智能论文笔记

Randomized-to-Canonical Model Predictive Control for Real-world Visual Robotic Manipulation

Tomoya Yamanokuchi , Yuhwan Kwon , Yoshihisa Tsurumine , Eiji Uchibe , Jun Morimoto , Takamitsu Matsubara

分类：机器人 | 机器学习

2022-07-05

最近，许多作品探索了SIM到真实传递的可传递视觉模型预测性控制（MPC）。但是，这样的作品仅限于一次性转移，必须收集一次现实世界的数据才能执行SIM到实现的传输，这仍然是一项重大的人类努力，在将模拟中学到的模型转移到真实的新域中所学的模型世界。为了减轻这个问题，我们首先提出了一个新型的模型学习框架，称为Kalman随机到典型模型（KRC模型）。该框架能够从随机图像中提取与任务相关的内在特征及其动力学。然后，我们建议使用KRC模型的Kalman随机到典型模型预测控制（KRC-MPC）作为零射击的SIM到真实转移视觉MPC。通过仿真和现实世界中的机器人手和模拟中的块配合任务，通过机器人手通过机器人手来评估我们方法的有效性。实验结果表明，KRC-MPC可以以零拍的方式应用于各种真实域和任务。

translated by 谷歌翻译

Model-Based Imitation Learning Using Entropy Regularization of Model and Policy

Eiji Uchibe

分类：机器学习 | 人工智能

2022-06-21

基于生成的对抗网络用于模仿学习的方法是有希望的，因为它们在专家演示方面是有效的样本。但是，培训生成器需要与实际环境进行许多交互，因为采用了无模型的强化学习来更新策略。为了使用基于模型的增强学习提高样品效率，我们在熵调控的马尔可夫决策过程中提出了基于模型的熵调查模仿学习（MB-eril），以减少与实际环境的相互作用数量。 MB-eril使用两个歧视因子。策略歧视者将机器人与专家的动作区分开来，模型歧视者区分了由模型产生的反事实状态转变与实际模型的转变。我们得出结构化的歧视者，以便学习政策和模型是有效的。计算机模拟和实际机器人实验表明，与基线方法相比，MB-eril实现了竞争性能，并显着提高了样品效率。

translated by 谷歌翻译

Sigmoid-Weighted Linear Units for Neural Network Function Approximation in Reinforcement Learning

Stefan Elfwing , Eiji Uchibe , Kenji Doya

分类：

2017-02-10

In recent years, neural networks have enjoyed a renaissance as function approximators in reinforcement learning. Two decades after Tesauro's TD-Gammon achieved near toplevel human performance in backgammon, the deep reinforcement learning algorithm DQN achieved human-level performance in many Atari 2600 games. The purpose of this study is twofold. First, we propose two activation functions for neural network function approximation in reinforcement learning: the sigmoid-weighted linear unit (SiLU) and its derivative function (dSiLU). The activation of the SiLU is computed by the sigmoid function multiplied by its input. Second, we suggest that the more traditional approach of using on-policy learning with eligibility traces, instead of experience replay, and softmax action selection with simple annealing can be competitive with DQN, without the need for a separate target network. We validate our proposed approach by, first, achieving new state-of-the-art results in both stochastic SZ-Tetris and Tetris with a small 10×10 board, using TD(λ) learning and shallow dSiLU network agents, and, then, by outperforming DQN in the Atari 2600 domain by using a deep Sarsa(λ) agent with SiLU and dSiLU hidden units.

translated by 谷歌翻译

Feature-based model selection for object detection from point cloud data

Kairi Tokuda , Ryoichi Shinkuma , Takehiro Sato , Eiji Oki

分类：计算机视觉 | 机器学习

2022-09-26

使用三维（3D）图像传感器的智能监视一直在智能城市的背景下引起人们的注意。在智能监控中，实施了3D图像传感器获取的点云数据的对象检测，以检测移动物体（例如车辆和行人）以确保道路上的安全性。但是，由于光检测和范围（LIDAR）单元用作3D图像传感器或3D图像传感器的安装位置，因此点云数据的特征是多元化的。尽管迄今已研究了从点云数据进行对象检测的各种深度学习（DL）模型，但尚无研究考虑如何根据点云数据的功能使用多个DL模型。在这项工作中，我们提出了一个基于功能的模型选择框架，该框架通过使用多种DL方法并利用两种人工技术生成的伪不完整的训练数据来创建各种DL模型：采样和噪声添加。它根据在真实环境中获取的点云数据的功能，为对象检测任务选择最合适的DL模型。为了证明提出的框架的有效性，我们使用从KITTI数据集创建的基准数据集比较了多个DL模型的性能，并比较了通过真实室外实验获得的对象检测的示例结果。根据情况，DL模型之间的检测准确性高达32％，这证实了根据情况选择适当的DL模型的重要性。

translated by 谷歌翻译

Boosting as Frank-Wolfe

Ryotaro Mitsuboshi , Kohei Hatano , Eiji Takimoto

分类：机器学习

2022-09-22

一些增强算法（例如LPBOOST，ERLPBOOST和C-ERLPBOOST）的目的是通过$ \ ell_1 $ -norm正则化解决软边距优化问题。 LPBoost在实践中迅速收敛到$ \ epsilon $ approximate解决方案，但众所周知，在最坏的情况下，$ \ omega（m）$迭代会在其中$ m $是样本量。另一方面，保证ErlpBoost和C-erlpBoost在$ O（\ frac {1} {\ epsilon^2} \ ln \ ln \ frac {m} {m} {m} {\ nu} {\ nu} {\ nu}）中保证将收敛到$ \ epsilon $ -Approximate解决方案$迭代。但是，与LPBoost相比，每次迭代的计算非常高。为了解决这个问题，我们提出了一个通用的增强方案，将Frank-Wolfe算法和任何次要算法结合在一起，并在迭代上互相切换。我们表明该方案保留与ERLPBoost和C-ErlpBoost相同的收敛保证。一个人可以合并任何次要算法以改进实践。该方案来自增强算法以进行软边距优化的统一视图。更具体地说，我们表明lpboost，erlpboost和c-erlpboost是Frank-Wolfe算法的实例。在实际数据集的实验中，我们方案的实例之一可利用次级算法的更好更新，并与LPBOOST相当地执行。

translated by 谷歌翻译

Novel projection schemes for graph-based Light Field coding

Bach Gia Nguyen , Chanh Minh Tran , Tho Nguyen Duc , Tan Xuan Phan , Kamioka Eiji

分类：计算机视觉

2022-06-09

在光场压缩中，基于图的编码功能强大，可以利用沿着不规则形状的信号冗余并获得良好的能量压实。然而，除了高度复杂性到处理高维图外，它们的图形构造方法对观点之间的差异信息的准确性非常敏感。在计算机软件生成的现实世界光场或合成光场中，由于渐晕效果和两种类型的光场视图之间的视图之间的巨大差异，将视差信息用于超射线投影可能会遭受不准确性。本文介绍了两种新型投影方案，导致差异信息的错误较小，其中一个投影方案还可以显着降低编码器和解码器的时间计算。实验结果表明，与原始投影方案和基于HEVC或基于JPEG PLENO的编码方法相比，使用这些建议可以大大增强超级像素的投影质量，以及率延伸性能。

translated by 谷歌翻译

Evolutionary Generation of Visual Motion Illusions

Lana Sinapayen , Eiji Watanabe

分类：神经与进化计算 | 人工智能 | 计算机视觉

2021-12-25

为什么我们有时会感知静态图像，好像他们在移动？视觉运动幻想享受持续普及，但对他们为何的问题没有明确的答案。我们提出了一种生成模型，进化错觉发生器（eIgen），它创造了新的视觉运动幻想。特征的结构支持虚幻动作可能是感知大脑自己的预测的结果，而不是感知从眼睛的原始视觉输入。本文的科学动机是证明了虚幻运动的感知可能是大脑预测能力的副作用。本文的哲学动机是引起注意“激励故障”的未开发潜力，作为生物系统失败的人工系统失败的方式，作为人工智能和人工生命研究的有价值的出口。

translated by 谷歌翻译

JaMIE: A Pipeline Japanese Medical Information Extraction System

Fei Cheng , Shuntaro Yada , Ribeka Tanaka , Eiji Aramaki , Sadao Kurohashi

分类：自然语言处理 | 人工智能

2021-11-08

我们为日本医疗信息提取提供了一个开放式自然语言处理工具包。我们首先提出了一种新的关系注释架构，用于调查日本医疗报告中医学实体的医疗和时间关系。我们通过单独注释两种不同类型的报告来尝试实用的注释方案。我们设计了一个带有三个组件的管道系统，用于识别医疗实体，分类实体模式和提取关系。经验结果表明，准确的分析性能，提出了令人满意的注释质量，针对报告类型的有效注释策略，以及最新的上下文嵌入模型的优越性。

translated by 谷歌翻译

Simplified and Unified Analysis of Various Learning Problems by Reduction to Multiple-Instance Learning

Daiki Suehiro , Eiji Takimoto

分类：机器学习 | (统计)机器学习

2019-11-14

在统计学习中，到目前为止已经提出了许多问题公式，例如多级学习，互补的学习，多标签学习，多任务学习，这些学习为各种现实世界任务提供了理论模型。尽管它们已经进行了广泛的研究，但它们之间的关系尚未得到充分研究。在这项工作中，我们专注于一种称为多构想学习（MIL）的特定问题，并证明包括上述所有问题（以及一些新问题）的各种学习问题可以通过理论上保证的概括范围，在其中将一些新问题降低到MIL减少是根据我们作为副产品提供的新还原方案确定的。结果表明，MIL-REDUCTION为设计和分析各种学习问题的算法提供了一个简化而统一的框架。此外，我们证明了还可以将MIL-REDUCTION框架进行内核。

translated by 谷歌翻译